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摘 要 : 经 过 十 余年 的 不 断 建设 和 发 展 ,中国 虚 拟 天 文 台 ( China-VO ) 已 成 为 支撑 天 文 
学 观测 、 研 究 、 教 学 的 重要 技术 和 资源 平台 。 随 着 多 信使 天 文学 和 时 域 天 文学 时 代 的 到 来 ， 
虚拟 天 文 台 也 需要 升级 自身 的 核心 能 力 ,以 给 天 文 工 作 者 提供 更 精准 的 服务 和 技术 支撑 。 为 
此 ,中 国 虚 拟 天 文 台 团 队 结合 天 文学 的 发 展 方向 和 信息 技术 发 展 趋势 梳理 了 一 份 核心 技术 需 
求 清单 ,并 以 问 着 的 形式 针对 领域 内 专家 和 用 户 开 展 了 调研 。 通 过 对 调研 结果 的 统计 和 分 析 ， 
中 国 虚拟 天 文 台 明 确 了 未 来 一 段 时 期 的 主要 努力 方向 和 目标 ， 计 划 采 用 平台 化 的 开发 模式 ， 
并 开放 第 三 方 开发 接口 ， 以 吸引 更 多 感 兴趣 的 开发 者 基于 虚拟 天 文 台 资源 做 出 实用 的 工具 ， 
更 好 地 实现 资源 与 技术 向 服务 的 快速 转换 。 


关键 词 : 虚拟 天 文 台 ; 功能 需求 ; 多 信使 天 文学 ; 时 域 天 文学 ; 
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0 虚拟 天 文 台 现状 


随 着 天 文学 的 不 断 发 展 ,科研 协作 日 益 广泛 ,传统 的 研究 模式 也 必须 改变 ,2000 年 前 后 
为 了 实现 对 天 文 数据 所 有 访问 过 程 的 标准 化 , 天 文学 家 提出 了 一 个 跨 天 文学 科 、 计 算 机 学 科 、 
言 息 学 科 的 概念 一 一 虚拟 天 文人 台 (Virtual Observatory, VO) 。V0 是 通过 先进 的 信息 技术 
将 全 球 范 围 内 的 天 文 研究 资源 无 颖 透明 地 连结 在 一 起 形成 的 环境 , 用 于 数据 密集 型 网 络 化 天 
文 研究 和 科普 教育 ”"。V0 通 过 利用 最 先进 的 计算 机 和 信息 技术 将 各 种 天 文 研究 资源 ， 包 括 观 
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测 数据 、 天 文 文献 、 计 算 资 源 、 存 储 资源 、 软 伯 


式 无 颖 地 》 


数据 服务 系统 的 访问 标准 ， 已 经 成 为 天 文学 研究 重要 的 信息 化 支撑 平台 。 


2002 年 ， 


发 领域 包括 中 国 


以 中 国 科 学 院 国 家 天 文人 台 为 首 的 中 国 天 文学 界 提出 了 中 
(China-V0) 的 设想 。China-V0 的 重点 而 


外 天 文 研究 资源 的 统一 访问 、 基 于 V0 的 天 文 而 
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服务 ， 甚 至 天 文 观 测 设备 ， 以 统一 的 服务 模 
集 在 一 个 物理 上 分 散 、 逻 辑 上 统一 的 系统 。 经 过 近 二 十 年 的 发 展 ，V0 统 一 了 各 个 


国 虚 拟 天 文 台 


虚拟 天 文 台 系统 平台 的 开发 、 国 内 
究 示 范 和 天 文科 普 教 育 等 几 个 方面 ”。 


China-V0 的 目标 是 在 天 文学 和 信息 技术 之 间 起 到 桥梁 和 纽带 的 作用 ,促进 先进 的 信息 技术 能 


够 服务 于 天 文学 的 研究 。 


2013 年 , China-V0 基 于 CloudStack 云 计算 中 间 件 开始 了 公 
个 地 方 部 署 了 云 节点 。 自 2016 年 下 半年 开始 , 以 国 
China-V0 全 面 探索 “公共 云 + 专 有 云 ” 的 混合 架构 方案 。 
台 站 和 中 科 院 现 有 的 网 络 、 存 储 、 计 算 等 基础 设施 ,借助 信息 领域 和 V0 领域 的 先进 关键 技术 ， 


以 天 文 观测 数据 汇 交 、 共 享 和 使 用 及 国内 核心 天 文 观测 设备 的 时 间 
天 文 观测 和 科研 活动 所 需 计算 、 存 储 、 软 件 等 资源 ， 


络 化 科学 研究 平台 。 


现 阶段 , China-V0 公 共 服 务 平台 已 经 发 展 出 国 


家 天 文 台 - 阿 上 


服务 平台 的 研发 , 在 国内 多 
E 云 建立 战略 合作 为 切入 点 ， 
China-V0 云 服务 平台 充分 利用 了 各 


请 、 审 批 为 线索 ， 融 合 


形成 一 个 物理 上 分 散 、 风 辑 上 统一 的 网 


ARLE GER) KELURLAR HK), 


上 海天 文 台 《上 海 ) 、 云 南天 文 全 (昆明) 、 新 疆 天文 台 (乌鲁木齐 ) 、 南 京 大 学 《南京 ) 


和 阿里 云 〈 杭 州 ) 等 7 个 节点 ; 为 兴 


ELAMOST, 13. 7 米 毫 米 波 望 远 镜 、 余 山 1. 56 米 、 丽 江 2. 4 


米 、 南 山 25 米 等 10 多 套 观测 设备 提供 数据 管理 和 开放 共享 服务 ;为 丽江 2. 4 米 、 兴 隆 2. 16 米 


等 望远镜 提供 时 间 申 请 服务 ; 为 中 国 科 学 院 大 学 、 南 京 大 学 
研 用 户 提供 虚拟 机 等 服务 ; 基于 国内 业余 天 文 观测 数据 发 现 了 19 颗 超新星 和 新 星 ; 注册 用 户 


超过 21000 人 。2015 年 初 ，China- 


联网 + ?大 数据 时 代 ,China-V0 正 在 为 天 文学 的 发 展 发 挥 着 越 来 越 大 的 信息 化 支撑 服务 作用 。 


1 新 的 需求 和 挑战 


随 着 双 中 子 星 并 合 引 力 波 事 伯 
IceCube-170922A 高 能 中 微 子 的 BL AEE A Ti 
现 的 新 时 代 。 与 此 同时 ， 以 LSST 和 SKA 为 代表 的 时 
的 探索 和 发 现 新 时 代 , 同时 也 带 来 了 
赖 信息 技术 ， 需 要 一 个 非常 强大 的 网 
测 、 分 类 和 发 布 ， 以 及 数据 的 高 效 融合 等 。 天 文学 正在 从 发 现 妃 


科学 引导 的 科学 ， 即 数据 密集 型 和 


等 提供 云 教学 环境 ; 为 上 干 位 科 


V0 入 选 “ 中 国 科 学 院 科研 信息 化 十 大 优秀 案例 ”。 在 “ 互 


体制 变革 到 新 的 数据 极 大 丰富 的 和 


络 系统 架构 ， 包 括 数据 处 到 


文 发 现时 代 的 挑战 。 


E GW170817 及 其 电磁 对 应 体 的 发 现 驯 ， 以 及 
FE 认 和 表征 内 ， 天 文学 进入 了 多 信使 科学 发 


域 概 要 式 巡 天 项 目 开局 了 时 域 天 文学 
巨大 挑战 。 多 信使 天 文学 和 时 域 天 文学 的 开展 强烈 地 依 
流水 线 ， 归 档 ， 事 件 自 动 检 
区 动 的 科学 转化 为 数据 驱动 、 
学。 而 VO 的 目标 正 是 要 把 天 文学 从 老 的 数据 贫乏 的 研究 
究 体 制 , 充分 利用 


言 乱 技术 来 解决 数据 密集 型 的 多 信使 天 


新 时 代 带 来 的 挑战 对 于 VO 的 技术 支撑 能 力 提 出 了 更 高 的 要 求 。China-V0 虽然 已 经 有 
了 相当 的 资源 和 技术 积累 ,但 距离 时 域 天 文学 和 多 信使 天 文学 所 需 研 究 的 能 力 和 技术 需求 还 


战 ， 其 中 关键 的 一 个 方面 是 实时 的 大 数据 流 处 到 


存在 很 大 的 差距 ,新 一 代 观 测 设备 产生 的 PB 级 的 数据 流 给 数据 的 处 理 和 挖 扬 带 来 了 全 新 挑 


分 析 55 9。 由 于 大 量 的 多 信使 观测 和 时 域 观 


测 的 事件 是 暂 现 的 , 事件 的 检测 以 及 及 时 恰当 的 随 动 观测 非常 重要 。 这 需要 从 望远镜 获取 数 
据 的 同时 就 进行 数据 处 理 ， 自 动 可 靠 地 检测 、 分 析 暂 现 事 件 ， 并 根据 优先 级 安排 及 时 的 随 动 
观测 。 此 外 ,还 需要 程控 望远镜 蔡 代 人 工 来 编排 并 执行 时 域 观测 ， 并 自动 完成 时 域 事 件 的 发 


现 和 分 类 。 


,以往 的 数据 融合 研究 主要 集中 在 多 波段 方面 ， 


以 上 过 程 中 的 需求 可 以 概括 为 “多 波段 、 多 信使 海量 数据 的 高 效 融 合 ”。 数 据 融 
合 与 互 操作 是 VO 的 核心 科学 目标 和 技术 能 


作 期 刊 


多 信使 数据 的 融合 研究 才刚 刚 起 步 。 同时, 传统 的 数据 融合 与 互 操作 研究 大 多 是 为 满足 传统 
科研 课题 的 需要 ， 而 不 是 时 域 天 文学 科学 计划 甚至 科学 工程 的 需要 , 对 于 完成 时 限 等 性 能 7 


面 的 问题 没有 严肃 的 考 
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2 核心 能 力 调 研 


基于 以 上 认 知 ，China-VO 团队 针对 时 域 天 文学 和 多 信使 天 文学 涉 
求 进行 了 梳理 ， 并 以 调查 问卷 的 形式 向 China-VO 学 术 委 员 会 的 专家 和 广大 用 户 公 开征 求 意 
见 ， 和 希望 通过 这 样 的 调查 确定 未 来 一 段 时 期 的 主要 努力 方向 和 目标 。 调 研 问卷 包含 了 


China-VO 团队 所 提供 的 服务 内 容 的 各 个 方面 ， 涉 及 文件 存储 服务 、 数 据 检索 服务 、 数 据 可 
视 化 、 交 叉 证 认 服 务 、 在 线 计算 服务 、 远 程 天 文 台 自 动 化 控制 、 


拓展 建设 共 8 个 部 分 。 


= 


每 个 部 分 包含 若干 具体 关键 技术 点 ， 共 计 23 条 


述 了 每 条 关键 技术 的 应 


范围 和 技术 特征 ， 具 体 如 表 1。 


R 1 中 国 虚拟 天 文 台 核 心 功能 调研 明细 
Table 1 Contents of China-VO Core Functions Survey 


自动 化 数据 分 类 方法 、 平 台 


因此 ， 目 前 China-V0 尚 不 完全 具备 “多 波段 、 多 信使 海量 数据 


及 的 主要 关键 技术 需 


具体 需求 。 问 卷 中 描 


文件 存 取 本 地 大 容量 | 通过 分 布 式 存储 、 平 行 扩展 等 方式 实现 大 量 文件 的 高 速 在 取 、 查 | 超大 文件 的 存 取 
高 速 文件 存 | 找 本 地 文件 
了 
异地 数据 存 | 了 解数 据 存储 情况 ， 快 速 取得 所 需 远 程 数据 台 站 数据 获取 、 远 程 数 据 同 
i 步 、 数 据 异地 备份 等 
分 级 节能 存 | 热 数 据 、 温 数据 、 冷 数据 的 分 级 存储 ， 达 到 节省 资源 的 目的 机 房 数据 存储 实践 
fik 
数据 检索 大 星 表 检索 | 切 分 大 数据 至 多 个 节点 并 分 别 检索 ， 再 合并 检索 结果 
异地 数据 检 | 同一 平台 上 访问 多 地 数据 


在 线 计算 


在 线 调 用 数据 ， 并 使 用 服务 器 资源 进行 在 线 处 理 、 计 算 。 结 果 保 


存 于 在 线 存储 中 


大 规模 数据 在 线 处 理 


CasJobs 深度 
整合 


将 CasJobs 合并 到 虚拟 天 文 台 体 系 


Jupyter Hub 
在 线 计 算 、 画 
图 


在 线 编写 Python 程序 ， 使 用 服务 器 计算 资源 进行 计算 ， 结 果 保 
存在 服务 器 上 


交叉 证 认 多 波段 数据 


光学 、 射 电 等 多 波段 数据 ， 以 及 点 源 、 展 源 交叉 证 认 方 法 


查找 观测 目标 在 多 波段 的 


高 性 能 交叉 对 应 体 

证 认 方法 

多 信使 数据 | 引力 波 与 多 波段 数据 交叉 证 认 引力 波 电磁 对 应 体 候选 体 
交叉 证 认 方 列表 

法 

交叉 证 认 方 | 提供 交叉 证 认 方 法 的 置信 度 取得 数据 可 信 度 


法 的 置信 度 
估计 
动 化 数据 | 图 像 数据 特 | 通过 卷 积 神经 网 络 的 卷 积 层 自动 提取 图 像 数据 中 的 特征 帮助 更 深入 了 解数 据 ， 并 为 
分 类 方法 “| EAZ 数据 分 类 提供 思路 
AL Aa) | 通过 深度 学 习 等 方法 对 图 像 数据 、 光 要 曲线 数据 进行 训练 和 学 | 基于 时 域 天 文学 的 需求 ， 蜀 
分 类 习 ， 实 现 暂 现 源 自动 分 类 现 源 高 效 自动 化 分 类 是 重 
要 一 环 
光谱 数据 特 | 使 用 聚 类 、 降 维 等 方法 对 光谱 数据 实现 特征 提取 ， 并 通过 是 深度 | 面向 时 域 天 文学 的 需求 ， 提 
征 自动 提取 | 学 习 方法 实现 自动 分 类 高 光谱 数据 的 分 析 处 理 效 
可 视 化 图 像 拼 接 及 | 对 观测 图 像 进行 拼接 并 重新 分 割 ， 实 现 类 似 地 图 的 在 线 放 大 、 缩 | 全 天 星 图 展示 
分 层 可 视 化 | 小 展示 
星 表 分 层 可 | 根据 亮度 或 其 他 条 件 逐 步 展示 星 表 数据 查看 全 天 星 表 分 布 
视 化 
编程 接 文件 存 取 接 | 可 通过 编程 接口 来 使 用 虚拟 天 文 台 中 的 各 个 功能 第 三 方 软件 开发 
、 数 据 检索 
s 关口 、 在 线 计 
《 接口 等 功 
能 的 编程 接 
pe 权限 控制 | 文件 、 数据 检 | 限制 特定 用 户 对 特定 文件 、 数 据 表 、 或 其 他 功能 的 访问 数据 保护 
3) 索 、 在 线 计算 
7 等 功能 的 权 
限 限制 
云 平台 实现 基于 专 有 云 或 阿里 云 等 公有 云 平台 对 以 上 系统 进行 实现 系统 的 多 地 部 轩 
实用 工具 整 | 在 线 Tatex 撰 | KEL ww. overleaf. com 的 工具 ， 可 在 线 编写 论文 、 共 享 编 加 
合 5 
= 在 线 文件 分 | 类 似 在 线 网 盘 ， 提 供 第 三 方 工具 访问 接 
远程 天 文 台 | 多 种 应 用 场 | 眉 入 式 技术 、 标 准 通讯 协议 使 系统 功能 多 样 满足 不 同 用 户 的 控制 需求 
动 化 控制 | 景 
系统 智能 化 | 程控 自主 、 基 于 机 器 学 习 使 观测 更 加 智能 化 观测 自动 化 与 智能 化 
权限 管理 登陆 权限 、 控 制 权 限 、 资 源 访问 权限 权限 管理 


本 文 分 别 对 这 8 个 部 分 的 需求 进行 了 前 治 技术 的 调研 .如何 实现 高 效 的 文件 存储 服务 和 


数据 检索 服务 一 直 是 VO 领域 的 研究 热点 。 除 了 本 地 大 数据 的 高 速 读 写 ， 随 着 多 节点 数据 中 
心 的 不 断 建设 , 异地 数据 检索 和 分 级 存储 也 是 当前 研究 的 重点 。 天 文 数据 的 存储 格式 是 比较 


多 元 化 的 ， 主 流 数据 格式 包括 FITS. CASA 和 HDF5， 大 量 碎 片 化 的 数据 带 来 了 极 高 的 IO 
消耗 ， 因 而 迫切 需要 实现 海量 数据 的 并 行 读 写 策略 、 分 布 存 储 策 略 ,并 提供 无 颖 的 数据 访问 
服务 。 现 阶段 业界 较为 流行 的 分 布 式 并 行 存储 系统 包括 Lustre, Haystack, HDFS. TFS 等 ， 

它们 设计 思路 基本 相似 , 主要 包含 一 个 底层 的 文件 存储 系统 及 一 个 目录 服务 , 通过 高 效 的 目 
录 检 索 进 行 底层 文 件 的 存 取 。 除 了 分 布 式 文件 存储 系统 外 ， 高效 数 据 存 储 和 检索 还 依赖 于 高 
效 的 索引 技术 。 天 体 的 赤 经 赤 纬 是 二 维 向 量 , 通过 将 二 维 问 量 映射 为 一 维 数据 可 以 实现 对 天 
体 坐 标的 索引 。 可 行 的 方法 是 将 天 球面 划分 为 多 个 子 区 域 ， 并 给 予 子 区 域 以 唯一 编号 ， 实 现 
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对 空间 的 索引 。 较 为 常用 的 方法 包括 球面 三 角 网 格 划分 HTM、HEALPix 以 及 Zones 等 ,这 
些 方法 在 SDSS, MUSER, LSST 等 项 目 中 分 别 得 到 使 用 。 

数据 可 视 化 包括 了 图 像 分 层 可 视 化 和 星 表 分 层 可 视 化 , 主要 用 Sicha pun 
星 表 分 布 的 展示 。 这 里 主要 强调 了 分 层 的 可 视 化 ， 是 指 对 于 海量 数据 采用 基于 分 辩 率 、 星 
亮度 等 条 件 渐进 式 的 可 视 化 。 常 用 的 方法 为 层次 细节 技术 (LOD, Level of Details), 主要 实 
现 包括 四 叉 树 、 八 又 树 算法 等 。 美国 MAST 的 Skyview 系统 ,法国 CDS 的 Aladin 系统 均 实 
现 了 大 数据 条 件 下 的 全 天 图 像 的 拼接 。 

交叉 证 认 的 核心 方法 是 计算 两 个 目标 之 间 的 距离 , 如 果 小 于 阔 值 则 认为 两 个 目标 为 同一 
天 体 。 在 国内 外 , 交叉 证 认 的 研究 已 经 取得 了 一 系列 的 成 果 , 如 基于 HTM 索引 分 区 与 kd-tree 
KEARE, IEF MapReduce 的 分 布 式 交 叉 证 认 方 法 外 、 基 于 HEALPix 与 Zones 
Algorithm 的 GPU 集群 算法 中等。 但 是 在 多 波段 、 多 信使 数据 交叉 证 认 及 置信 和 度 估计 方面 还 
有 许多 关键 技术 需要 突破 。 

自动 化 数据 分 类 方法 主要 面向 时 域 天 文 领域 的 海量 数据 分 析 。 随 着 新 一 代 观 测 设备 的 不 

断 投入 使 用 , 将 会 获取 到 海量 的 不 同 波段 的 暂 现 源 观测 数据 , 现 有 的 数据 分 类 的 方法 已 不 能 
满足 大 数据 时 代 的 处 理 要 求 。 借 助人 工 智 能 方法 尤其 是 深度 学 习 方 法 将 是 一 条 可 行 之 路 。 在 

> 图 像 数 据 分 类 上 , 深度 学 习 方 法 已 经 发 展 出 一 系列 经 过 实际 应 用 检验 的 网 络 , 如 卷 积 神经 网 
络 中 的 ResNet, Alexnet. VGG 等 , 均 可 以 应 用 到 不 同 波段 图 像 数据 甚至 光谱 数据 的 分 类 中 。 

在 线 计算 服务 的 主要 目标 是 方便 科研 人 员 便 捷 高 效 的 进行 数据 处 理 , 无 需 将 大 量 的 数据 
从 线 上 存储 下 载 到 本 地 , 也 无 需 在 本 地 计算 机 上 部 署 复杂 的 数据 处 理 环 境 , 直接 通过 在 线 平 
台 进 行 数据 的 预 处 理 、 计 算 、 分 析 等 操作 。CasJobs 就 是 这 样 的 一 个 大 型 科学 数据 库 的 在 线 
工作 平台 ,以 网 络 应 用 的 形式 提供 强大 的 数据 库 检 索 和 操作 功能 ， 它 最 初 用 于 SDSS 的 数据 
在 线 处 理 ， 现 已 由 China-VO 团队 集成 至 LAMOST 的 巡天 星 表 数据 的 处 理 系 统 中 。Jupyter 
Hub 也 被 广泛 用 于 天 文 数据 的 在 线 处 理 。 它 的 使 用 方法 类 似 于 Jupyter notebook， 提 供 了 一 
个 在 线 的 Python 编写 与 运行 的 平台 ， 它 可 以 提供 多 用 户 的 登录 使 用 ， 后 台 可 以 是 算 力 强大 
的 计算 集群 ， 且 可 扩展 能 力 强 ， 是 实现 在 线 计 算 服务 的 良好 平台 。 

远程 天 文 台 和 凭借 连续 观测 、 快 速 反 应 等 方面 的 独特 优势 , 近 些 年 得 到 迅速 发 展 ， 国 内 乡 
已 开展 了 一 系列 基于 远程 天 文 台 的 时 序 巡 天 计划 ， 如 ROBONET、ROTSE-III、BOOTES 等 ， 在 
伽 玛 暴 余辉 和 其 它 暂 现 源 的 光学 观测 研究 上 都 有 了 良好 的 应 用 。 远程 天 文 台 由 望远镜 、 炙 道 


r= 仪 、 圆 项 、 计 算 机 、 和 气象 站 、 全 天 相机 等 设备 构成 ， 具 有 多 个 自动 化 的 软件 与 便 件 子 系统 ， 
© 它们 之 间 通 过 相互 协调 控制 实现 程控 观测 的 功能 。China-V0 经 过 多 年 的 调研 与 研究 ， 已 经 


提出 并 设计 了 一 套 基 于 嵌入 式 的 硬件 集成 系统 ,作为 用 户 与 天 文 台 设 备 间 连接 的 桥梁 , 以便 
于 各 子 系统 的 集成 控制 和 扩展 移植 ”, 未 来 将 在 此 基础 上 进一步 优化 , 重点 开展 智能 化 观测 
的 应 用 研究 。 

平台 拓展 建设 主要 涵盖 了 China-VO 平台 自身 服务 能 力 的 完善 ,包括 更 灵活 的 用 户 权限 ， 
实用 科研 工具 的 整合 , 便捷 的 第 三 方 应 用 程序 开发 接口 , 以 及 基于 专 有 云 或 公有 云 的 平台 实 
现 。 这 些 基于 基础 设施 的 功能 拓展 能 够 为 用 户 提供 更 好 的 服务 体验 ， 进 一 步 提升 用 户 粘性 。 


3 调研 结果 分 析 


本 次 调研 通过 邮件 问卷 和 在 线 问卷 两 种 方式 进行 , 共 收 到 12 份 China-V0 学 术 委 员 会 专 
家 的 反馈 ，65 份 China-VO 邮件 列表 和 网 络 用 户 反 馈 。 用 户 群 体 主 要 包括 天 文 领域 科研 工作 
者 和 研究 生 ， 均 具有 China-VO 公共 服务 平台 使 用 经 验 。 


3.1 统计 方法 


201907.00024v1 


chinaXiv 


ChinaXiv 合 作 期 刊 


在 做 反馈 统计 时 给 予 专家 反馈 以 3 倍 的 权重 进行 加 权 , 共 视 为 101 份 问卷 。 根据 问卷 分 


值 * 分 值 数 占 总 数 比 例 ， 分 别 计 算出 问卷 中 8 个 大 类 、23 条 具体 需求 的 分 值 。 


3.2 调研 结果 
图 1 为 8 个 大 类 的 具体 反馈 结果 ， 按 分 值 高 低 依次 排序 〈 分 值 为 0-5 分 ， 分 值 越 高 ， 表 


示 该 需求 越 重 要 )。 其 中 得 分 最 高 项 为 文件 存储 服务 〈3.89 分 )、 其 次 分 别 为 数据 检索 服务 

(3.87 分 )、 数 据 可 视 化 〈3.68 分 )、 交 叉 证 认 服务 (3.52 分 )、 在 线 计算 服务 (3.39 分 入 远 
程 天 文 台 自动 化 控制 (3.36 分 )、 自 动 化 数据 分 类 方法 (3.21 分 )、 平台 拓展 建设 (3.11 分 )。 
图 2 为 23 条 具体 需求 的 得 分 情况 。 


4.5 


3.89 3.87 3.68 
3.52 3.39 3.36 
| | | | | 
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图 1 各 项 需求 大 类 别 的 反馈 结果 


Fig. 1 Feedback Results for Main Categories of Requirements 
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图 2 具体 需求 得 分 情况 


Fig. 2 Feedback Results of Each Sub-requirement 


此 外 ， 本 文 将 China-VO 学 术 委员 会 专家 的 答复 单独 进行 了 统计 。 专 家 打分 与 问卷 总 体 
分 值 相差 不 大 ， 具 体 为 文件 存储 服务 〈4.11 分 )、 其 次 分 别 为 数据 检索 服务 (3.96 分 )、 数 据 
可 视 化 (3.92 分 )、 自 动 化 数据 分 类 方法 (3.59 分 )、 交 叉 证 认 服 务 (3.47 分 )、 在 线 计算 服 
Z (3.44 分 )、 平 台 拓展 建设 (3.03 分 )、 远 程 天 文 台 自 动 化 控制 (2.86 分 )， 专 家 打分 与 总 
体 打分 之 间 的 区 别 如 图 3 所 示 。 专家 给 出 的 各 项 分 值 均 比 总 体 打分 的 分 值 略 高 , 可 见 专家 对 
VO 团队 的 需求 梳理 有 较 高 认可 。 此 外 ， 专 家 打分 中 自动 化 数据 分 类 方法 与 远程 天 文 台 自动 
控制 的 得 分 与 总 体 打分 差异 较 大 ， 可 见 专 家 与 用 户 对 这 两 类 需求 持 不 同意 见 。 
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图 3 总 体 打分 与 专家 打分 之 间 的 对 比 
Fig.3 Comparison between overall scoring and expert scoring 

3.3 分 析 与 思考 

从 反馈 结果 中 可 以 看 出 ,数据 的 可 获取 性 、 数 据 操作 的 便捷 性 , 仍 是 对 VO 的 核心 需求 。 
天 文学 家 所 关注 的 始终 是 如 何 更 方便 地 分 析 、 处 理 数 据 。 现 阶段 ，China-VO 维护 的 中 国 天 
文 数据 中 心 提供 21 个 数据 集 的 归档 和 查询 服务 ， 用 户 可 直接 在 线 进行 数据 检索 和 下 载 。 公 

共 服 务 门 户 提供 了 虚拟 计算 资源 和 存储 资源 服务 , 通过 云 平 台 的 在 线 控制 台 , 用 户 可 以 自行 
定制 需要 的 计算 资源 和 存储 资源 同时 ， 基 于 国家 天 文 台 与 阿里 云 的 战略 合作 ， 用 户 也 可 以 
使 用 阿里 云 的 计算 资源 。 但 是 ，VO 的 数据 在 线 检 索 和 处 理 还 未 能 实现 一 体 化 服务 ， 提 高 服 
务 的 易 用 性 、 便 捷 性 将 是 今后 工作 的 一 个 重点 。 

数据 可 视 化 、 交 叉 证 认 服 务 、 在 线 计算 服务 ， 这 些 需 求 是 数据 处 理 需 求 的 延伸 ， 也 是 
VO 提供 便捷 服务 的 突破 点 。China-VO 团队 前 期 已 经 开展 了 一 些 工 作 ， 包 括 面向 天 文科 普 
教育 所 研发 的 天 文 数 据 可 视 化 平台 “万 维 望远镜 ”; 以 云 平 台 虚 拟 机 模板 的 形式 发 布 了 常用 数 
据 处 理 环 境 , 如 为 中 国 科学 院 大 学 多 波段 数据 处 理 课程 所 研发 的 虚拟 机 处 理 模板 , 其 中 包含 
了 CFITSIO、Graphviz、GSL 等 科学 数据 处 理 程序 库 ， 用 户 基于 它 生 成 虚拟 机 即 可 方便 的 使 
用 。 未 来 将 在 提高 服务 的 易 用 性 、 便 捷 性 的 同时 ， 进 一 步 加 强 相关 资源 和 服务 的 宣传 ， 使 用 
户 更 好 的 了 解 China-VO 已 有 的 功能 ， 从 而 提供 更 优质 的 服务 。 

致力 实现 数据 存 取 、 和 查询 、 处 理 的 一 体 化 在 线 服 务 始终 是 China-VO 的 目标 。 但 是 ， 当 
前 实现 VO 核心 需求 仍 存在 相当 的 困难 ， 主 要 体现 在 需求 的 高 难度 、 大 体 量 和 VO 研发 人 员 
不 足 之 间 的 矛盾 。 将 China-VO 积累 的 数据 、 存 储 、 计 算 资 源 转 换 为 高 效 便捷 服务 ， 需 要 大 
量 的 研发 人 员 ， 但 在 现 有 体制 下 ， 进 一 步 增加 研究 人 员 编 制 是 不 现实 的 。 为 此 ，China-VO 
Me 通过 开放 VO 第 三 方 开发 接口 , 吸引 更 多 感 兴趣 的 开发 者 基于 
VO 资源 做 出 实用 的 工具 ， 实 现 资源 与 技术 向 服务 的 快速 转换 。 

图 4 展示 的 是 下 一 阶段 China-VO 平台 的 体系 架构 设计 ， 最 底层 是 资源 层 ， 既 包括 存储 
服务 器 和 计算 服务 器 等 硬件 资源 ， 也 包括 了 China-VO 归档 的 各 类 数据 集 。 在 资源 层 之 上 是 
关键 技术 层 ， 该 层 向 下 连接 ,通过 虚拟 化 技术 调用 资源 层 的 人 硬件 资源 ， 并 通过 数据 检索 算法 
和 数据 库 工 具 调 用 数据 资源 ， 同 时 将 VO 涉及 的 各 项 关键 技术 进行 封装 形成 类 库 ， 实 现 基 于 
便 件 资源 和 数据 资源 的 按 需 计算 。 这 些 封装 的 关键 技术 包括 数据 检索 方法 、 不 同 星 表 间 的 交 
叉 证 认 方法 、 各 类 天 文 数 据 的 可 视 化 方法 、 基 于 机 器 学 习 的 数据 分 类 方法 等 ,并且 可 以 随 着 
研发 的 不 断 深入 逐步 扩展 。 
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图 4 中 国 虚拟 天 文 台 平台 体系 架构 
Fig. 4 China-VO platform architecture 

关键 技术 层 之 上 是 接口 层 ， 也 是 China-VO 下 一 阶段 将 着 力 建 设 的 部 分 ， 通 过 将 VO 的 
软 人 硬件 资源 、 关 键 技术 封装 为 应 用 程序 接口 (Application Program Interface，API)， 发 布 给 
广大 的 天 文 工 作者 , 辅 以 完善 的 文档 参考 和 培训 支持 , 使 他 们 能 够 根据 自己 的 科研 需求 建立 
新 的 应 用 。 依 据 本 次 调研 的 结果 ， 文 件 存 取 、 数 据 检索 、 数 据 可 视 化 、 交 又 证 认 相 关 的 API 
将 优先 开放 ， 相 应 的 文档 资料 和 应 用 示例 代码 将 会 通过 China-VO 网 站 向 用 户 发 布 。 

研究 人 员 通 过 China-VO API 构建 的 应 用 ， 可 以 注册 在 China-VO 平台 上 ， 提 供给 更 多 
的 用 户 使 用 。 这 些 应 用 将 构成 China-VO 平台 的 应 用 与 服务 层 。 基 于 统一 的 应 用 开发 标准 和 
应 用 程序 框架 , 这 些 应 用 可 以 跨 平 台 的 运行 在 移动 端 和 桌面 的 浏览 器 中 , 并 且 在 统一 用 户 账 
户 的 管理 下 ， 用 户 可 以 无 颖 衔接 的 访问 不 同 平台 的 应 用 和 数据 。 


4 总 结 展望 


综 上 所 述 , 通过 本 次 核心 功能 需求 调研 , China-VO 明确 了 下 一 阶段 的 建设 重点 和 目标 。 
China-VO 团队 将 重点 提高 数据 的 可 获取 性 和 数据 操作 的 便捷 性 ， 并 努力 完善 数据 可 视 化 、 
交叉 证 认 、 在 线 计 算 等 在 线 服 务 。 但 是 ， 当 前 VO 的 高 需求 与 研发 人 员 不 足 的 矛盾 也 日 益 突 
出 。 为 此 ， 将 采用 平台 化 的 开发 模式 ， 通 过 开放 VO 接口 ， 吸 引 开发 者 基于 VO 的 资源 和 关 
键 技术 做 出 更 多 实用 的 服务 和 工具 ， 并 通过 China-VO 平台 实现 共享 。 通 过 这 种 方式 不 断 提 
升 VO 的 核心 能 力 ， 使 之 形成 一 个 面向 科研 需求 的 应 用 生态 系统 ， 从 而 更 好 地 应 对 时 域 天 文 
学 时 代 和 多 信使 天 文学 时 代 带 来 的 挑 成 。 
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Abstract: After more than ten years of construction and development, China Virtual 
Observatory (China-VO) has become an important technology and resource platform to support 
astronomical observation, research and teaching. With the advent of multi-message astronomy and 
time-domain astronomy, the VO also needs to upgrade its core capabilities to provide astronomers 
with more precise service and technical support. To this end, based on the development direction 
of astronomy and the development trend of information technology, the China VO team combed a 
list of core technology requirements of VO, and conducted a survey on VO experts and users of 
China VO platform. Through the statistics and analysis of the survey results, China VO has 
defined the main efforts and goals for the next period of time, plans to adopt a platform-based 
development model, and open third-party development interfaces to attract more interested 
developers, who can make more practical tools based on VO resources, to better realize the 
transition of resources and technology to services. 

Key words: Virtual observatory; Functional requirements; Multi-messenger astronomy; Time 


domain astronomy; 


